Swoim problemem badawczym obrałem sprawdzenie, jak model wizualizacji danych wpływa na czytelność wykresu. Postanowiłem wykorzystać do tego istniejące dane w postaci przykładowego wykresu, który znalazłem w internecie. W miarę własnych możliwości odczytałem pewną część tych danych, a następnie zaprezentowałem ją w dwóch postaciach - wykres “scatter3d” stworzony za pomocą biblioteki plot_ly oraz wykres “geom_col” stworzony za pomocą ggplot2. Oryginalny wykres, choć nie jest przykładem nadzwyczaj różniącym się od wykresu pierwszego, też został rozpatrzony.
Do każdego przytoczonego wykresu były zadane trzy pytania, jedno z których nie obowiązkowe:
Poniżej zamieszczone są grafiki uzyskanych odpowiedzi:
Zdecydowana większość osób stwierdziła, że “scatter3d” jest nie czytelny, w tym samym czasie 3 część osób stwierdziła, że w sumie z wykresu oryginalnego łatwo odczytać informacje, gdy całość stwierdziła, że “geom_col” jest najbardziej przejrzysty.
Także możemy zauważyć, że postawiona wcześniej teza, że estetyczny wykres może być czytelny się nie sprawdziła, ponieważ w dwóch przykładach z trzech (czyli większość) zależność ta jest odwrotna.
Ważne uwagi z pól do ewentualnych sugestii:
Upraszczając, możemy powiedzieć, że wykresy 3D są złe z takich powodów jak brak widoczności wszystkich danych (nakładają się kropki, wyższe słupki są “bliższe” od tych niższych, więc ich przekrywają), z którym się wiąże problem dobierania perspektywy (na pierwszym wykresie trudno odczytać dane ze względu na nierównoległe wizualnie osie Export)
Z drugiej strony wykres 2D jest dobry, bo wszystkie dane są zilustrowane w jednym poziomie co pozwala na łatwe ich porównywanie, ale też na łatwe odczytanie wartości z osi.
Na koniec, prezentacja ostatecznego wyboru na temat najbardziej
czytelnego wykresu